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요 약 


미세한 차 이 를 고감도 식 별 하는 카오스 이 론 의 프랙탈 차 원 과 에 농 시 스 템 에 서 발 생 하는 이상한 끌개 
(8008086 40 ㅁ 80607) 를 이 용 하 여 문자 특 징 올 추출, 문자 인 식 에 적 용 하는 새로운 방 법 을 제 안 함 으로써 일반 
문자 뿐만 아니라, 문 자 들의 유 사 성 에 의해 오 인 식 되는 혼동 문 자 를 프랙탈 차원 해 석 에 의해 해 소 하 는 
고 정 도 문자 인식 시 스 템 을 구 현 한다. 먼저, 문자 영 상 으로부터 문 자 의 고유 성 질 을 나타내는 망 특징 및 
투영 특징, 교 차 거리 특징 등 올 1 차 구한 후, 이들 특 징 을 시계열 데 이 터 로 변 환 한 다음, 이를 본 논 문 에서 
제안한 수 정 된 에 농 시 스 템 을 이 용 하 여 , 6 (< 5601 표준 한글 2350 자 에 대한 각 각 의 문자 어 트 랙 터 를 재구성 
한다. 다음 단 계 에서는 개별 문자 어 트 랙 터 의 혼 돈 도 를 분 석 하 기 위해 각 각 의 문 자 에 대하여, 프랙탈 차 원 을 
나타내는 정보 차 원 값 (80×-001420010@ 101104608107, 퍼 214181 4416850476, 101077081 ㅁ 107 21, 10[011081107 121076081070) 
을 계 산 하여 문자 영 상 의 최종 특 징 을 구한다. 실 험 결과 한글 2350 자 에 대하여 99.49% 의 분 류 율 을 나타내어 
제 안 된 방 법 의 유 효 성 을 보였다. 
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1. 서 론 


카 오 스 (<1808) 이 론 은 결 정 론 적 비선형 동역학 
시 스 템 에서 나타나는 불 규 칙 하 고 예측 불가능한 양 
상 을 정 성 적 으 로 연 구 하는 학 문 이다. 카 오 스 란 말 은 
원래 무질서 또는 복 잡 함 을 뜻 하 는 고대 그 리 스 어 로 


이 논 문 은 2001 학 년도 김 포 대 학 연구비 지 원 에 의하여 
연 구 되었음 
` 종 신 회 원, 김 포 대학 컴 퓨 터 계열 멀 티 미 디 어 전공 조교수 


부터 유래 하였지만, 공 학 에서는 결 정 론 적 비선형 동 
역학 시 스 템 으로부터 생 성 되는 복 잡 하고 잡 음 과 같 
은 현상 을 말하며, 1980 년 대 말 부터 물리학, 생물학 
분 야 의 관심사 였던 카오스 이 론 이 최근 들어 공학 
및 의학 분 야 에도 커다란 영 향 을 미치고 있 다 .[1-3] 
이러한 영 향 은 그 동안 간 과 되었던 신 호 의 복잡한 
변화 속에 숨겨져 있는 동 역 학 적 정 보 를 얻어 낼 수 
있다는 점 에서 카 오 스 의 등 장 은 완전히 새로운 관점 
에 서 의 문제 해 결 법 을 제시해 주고 있다. 카오스 이 


론 의 공학적 응용 분 야 로는 비선형 잡음 제거 및 필 
터 , 패턴 인식, 음성 비화 시스템, 카오스 로봇 제어 
등 이 있으며, 최근 맥 파 , 뇌파, 심전도 분석 등과 같은 
생체 카 오 스 는 의료 진단 시 스 템 의 첨 단 화 의 가능성 
을 보 여 주 고 있 다 .[3-7] 

따라서 본 논 문 에서는 미세한 차 이 를 고감도 식별 
할 수 있는 카오스 이 론 을 패 턴 인식 분 야 에 웅 용 한 
다. 카오스 이 론 의 이상한 끌 개 (560 ㅁ 8086 쇼 『 ㄴ ㅠ 80[0[) 
를 생 성 하 는 에 농 함 수 를 이 용 하 여 , 문자 어 트 랙 터 를 
생 성 하 여 프랙탈 차원 특 징 을 추출, 문 자 를 인 식 하 는 
새로운 알 고 리 즘 을 제 안 하 였다. 


2. 문자 인식 기술 동향 


문자 인식 기 술 은 스 캐 너 나 펜 입 력 기 기 등 을 이 
용하여 입 력 된 문서 영 상 으로부터 각종 문자 정 보 를 
분리, 인 식 하 는 수 단 을 제 공 함 으로써, 수 작 업 에 의존 
하던 자료 입력 방 식 을 자 동 화 할 수 있다. 따라서 한 
글, 한자, 영어 등 의 문자 인 식 에 관한 많은 연 구 가 
있었으며, 신 문 이나 잡지 보고서 등 의 복잡한 문 서 를 
인 식 하기 위한 연 구 도 활발히 진 행 되고 있다 
[11-15]. 지 금 까 지 연 구 된 대표적인 문자 인식 방법 
으 로 는 저장된 문자 영 상 과 의 정합 정 도 를 인 식 하 는 
원형 정 합 법 (7'6072!0[6 \48601178 1160100), 문자 영 
상의 특징 벡 터 의 유 클 리 디안 거 리 로 인 식 하는 통계 
적 방 법 (5\30804081 460100), 그리고 문 자 를 구 성 하 
는 요 소 들의 구조적 연 관 성 을 비 교 하 여 인 식 하 는 구 
조적 방 법 (60400481 *460100) 동이 있다. 

1990 년 대 에 와 서 는 한글 문 자 를 인 식 하 는데, 어느 
정 도 의 변 형 이나 불완전한 입 력 에 대해서도 잘 작동 
하는 신 경 망 을 사 용 하려는 여러 시 도 가 있 었 다 .[11- 
15] 하지만 한 글 은 가능한 문 자 의 수가 큰 규 모 일 뿐 
만 아니라, 비교적 적은 수 의 기본 자 모 가 서로 결합 
하여 문 자 를 만들기 때문에 문 자 간에 유 사 성 이 커서 
한글 문자 인 식 은 매우 어려운 문 제 이다. 이러한 유 
사 성 이 큰 문 자 는 오 인 식 을 발 생 시 키 는 혼 동 문 자 로 
서 , 선 행 연 구 [11] 은 오 인 식 된 문 자 를 수 정 하 는 후처 
리 과 정 에서 처 리 를 하거나 혼 동 문자 인 식 부 를 따로 
두어 해 결 하였다, 또한 선 행 연 구 [10] 은 한글 찾 기 순 
상위 990 자 를 대 상 으로 문 자 의 망 특징 히 스 토 그램 
값 을 이 용 하 여 어 트 랙 터 를 구 성 하 고, 어 트 랙 터 의 차 
원 값 을 구한 다음, 문자 자 체 의 20※-(040008 1201- 
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101608100 을 함께 특 징 으로 사 용 하여 96.03% 의 인석 
을 을 보였다. 

하지만 보다 나은 특 징 을 추 출 하는 방 법 을 사용할 
경우 이러한 혼동 문 자 에 대한 범 위 를 줄 임 으로써 
보다 높은 인 식 율 을 기대할 수 있는 인 식 기 의 개 발 이 
가 능 하 다. 


3. 제 안 된 시 스 템 의 문자 특징 추출 


본 논 문 에서는 기 존 의 망 , 투영, 교 차 거리 특 징 방 
법 으로 1 차 특 징 을 추출한 후, 시계열 데 이 터 로 변환, 
문자 어 트 랙 터 를 생 성 한다. 


3.1 문자 어 트 랙 터 생성 


에 농 어 트 랙 터는 로렌츠 시 스 템 의 동 력 학 계 (27- 
18046 8796620) 를 단 순 화 한 모 델 로 부 메 랑 과 같은 
모 양 을 하고 있다. 에 농 시 스 템 은 1 차 원 의 동 력 학 계 
에서 2 차 원 적 인 변 환 에 의해 고 차 원 의 스트레인지 
어 트 렉 터 를 이끌어 낸다. 2 차 원 에서 발 생 하는 에 농 
시 스 템 의 팽 창 과 수 축 (566 하 아 -800-8010) 작 용 은 × 
와 의 2 차 원 좌 표 로 표현할 수 있다. 그러므로 에 농 
시 스 템 의 변환 함 수 는 평 면 에 서 발 생 하는 어 펀 변환 
(21606 17806[072708000) 과 유 사 하게 동 작 한 다 .[1.2] 
에 농 시 스 템 은 108 변 환 과 유 사 하게 임 의 의 상 수 인 
&, 6 그리고 시 작 점 인 (×6, 90) 에 민 감 하게 반 옹 한다. 
다시 말해서 카오스 이 론 의 특 징 인 초 기 조 건 에 민감 
한 의 존 성 을 보여준다. 에 농 은 초 기 조 건으로 23=1.4, 
1 ㅁ = 0.3 그리고 (※0, 70) = (0, 0) 으로 하였다. 에 농 어 
트랙터 함 수 는 다 음 의 식 (1) 과 같다. 


트 (6 0 = (카르 ~ 89 090, 
*=01 ㄴ 5283... 01) 


본 논 문 에서는 에 농 변환 함 수 에서 문자 어 트 랙 터 
를 가장 잘 반 영 하 는 상 수 값 을 찾기 위해 반복 실험 
한 결과, 임 의 의 상수 2=0.55, ㅁ =0.3 으 로 하였다. 
식 (2) 및 < 그 럼 1> 에 는 본 논 문 에서 제 안 된 수 정 된 
에 농 시 스 템 을 이 용 하 여 문자 영 상 의 시계열 데이터 
와 어 트 랙 터 재구성 예 를 나 타 내 었다. 


브 9, 90 
= 100+ ㅜ 1- ㄱ 86 에)“, 6500 + 야 )] (2) 


여기서, 01 는 문자 영 상 (}1912006 ㅠ 8680406) 으 로 
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부터 1 차 추 출 된 망 , 투영, 교 차 거리 특 징 을 시계열 
데 이 터 로 변 환 한 값 이 며 , = 0, 11 2 3, . . ㅁ 이다. 
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그림 1. 문자 영 상 의 시 계 열 과 어 트 랙 터 


3.2 프랙탈 차원 


재 구 성 된 문자 어 트 랙 터 로부터, 카오스 
량 적 으로 평 가 하 기 위해 프랙탈 차 원 (3031 01060- 
8100) 을 구한다. 프랙탈 차 원 은 카오스 이 론 에서 매 
우 중요한 의 미 를 가지며, 이러한 차 원 은 명확히 정 
의 할 수 없는 성질, 즉 어떤 물 체 의 거 칠 음 정도 혹은 
불규칙한 정 도 를 나타낸다. 이처럼 프랙탈 차 원 은 시 
계열 신 호 에 대해서 재 구 성 된 어 트 랙 터 의 기하학적 
특 징 을 표 현 하 며 , 신 호 의 카 오 스 적인 정 도 에 따라 그 
값 이 달라진다. 프랙탈 차 원 을 구하는 방법 중 80×- 
(:000008 1010608100 은 상관 차 원 ((;0 ㅁ ㅠ 히 80000 1010160- 
8100) 과 매우 유 사 하 며 , 비교적 간단한 계산 방 법 으 
로 프 로 그 래 밍 이 쉬워 많이 사 용 된다. 

(1) 208※-(0000068 10104608100 ㅁ 

20※-(>0470008 1010160591027 을 구하기 위해서는 먼 
저 전체 어 트 랙 터 를 포 함 하는 사각형 영 역 을 정 의 하 
고 이 영 역 의 한 변 을 1 로 하고 축 소 율 (603108@ 
13060) 5 로 영 역 을 분 할 한 후, 어 트 랙 터 를 포 함 하고 
있는 분 할 된 작은 영 역 들 의 수 를 헤 아 린다. 이렇게 
어 트 랙 터 를 포 함 하는 분할 영 역 의 수 를 띠 (6) 라 하고, 
120×-(:0400108 10107608100, 10 를 다음 식 (3) 으 로 부 


터 구한다. 


특 성 을 


. 10876) 

즐 1 1 켜 믹 대 데 터 레 제 메 리 테 제 라 
오가는 오 70 (3) 
실 험 에서는 6 의 크 기 를 1/4, 18, 1/16 로 하여 최적 

의 조 건 을 찾 아 나간다. 
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그림 2. 문자 “ 휠 " 의 60×-~06 ㅇ 41109 계 산 (6=1/16) 


(2) 제 304781 /1688416@ 

앞서 구한 80※×-(〉:04700068 10177608100 은 단지 어트 
랙 터 를 포 함 하 고 있는 분할 영 역 의 수 만 을 카 운 팅 하 
므로 어 트 랙 터 의 차 원 을 실제 버나 보 기 는 어 
렵 기 때문에 미세한 패 턴 을 분 리 하는 데 곧바로 적용 
하기에는 문 제 가 있다. 즉 분 할 된 영 역 이 어 트 랙 터 를 
포 함 하고 있 는 지 의 여부 만을 나 타 내 므 로 정 보 를 손 
실 하는 경 우 가 있다. 이러한 결 점 을 극 복 하 기 위해서 
는 분 할 된 영 역 들이 얼마나 많은 어 트 랙 터 의 궤 도 를 
포 함 하 느 냐 와 같은 방 법 을 이 용 해 서 가 중 치 를 가져 
야 한다. 이는 전체 어 트 랙 터 영역 중 어느 정 도 의 
어 트 랙 터 를 포 함 하 는 지 와 같은 백 분 율 로 나타낼 수 
있는데 이를 띠 804781 41685476, 4 27 라고 하며, 다음 
의 식 (4) 로 부터 구한다. 


. 1 군 
= 100- ㅡ > 1820, 
42) = 1 띠 그 읍 네 6820 (0 


여기서 1900, 3/0) 는 어 트 랙 터 (, % 가 분 할 된 영 
역 8 안에 있으면 1, 아니면 0 의 값 을 가 지 므로 다음 
의 식 (5) 과 같이 표현 된다. 


16100 
1 | (35. 6) 


0  001620\196 


그리고 는 전체 어 트 랙 터 를 구성 
하는 영역 중 분 할 영역 8 에 포 함 되 어 있는 궤 도 의 
수 를 나타낸다. 

본 논 문 에서는 다 음 의 식 (6) 을 이 용 해 서 제 하 481 
1635476 를 구 하 였 다. 


2080= 그 2. ^), =1.2.3,.. 페 (6) 


22 620 


여기서, 지은 전체 분 할 된 영 역 을, ㅁ 은 전체 어트 
랙 터 를 구 성 하 는 화 소 의 수 를 나타낸다. 

(3) 10600080000 21 & 1010608107 

1010110860020 21, 1(6) 는 떠 204201 468506 로 부터 
구 해 진 값 을 이 용 하 여 다음 식 (7) 로 부터 구한다. 


(8) 


1(6) = 2 (201082- ㅜ ㅜㅜ = 주 (7) 
본 논 문 에서는 다 음 의 식 (8) 를 이 용 하 여 14107 1 
를 계 산 하고 이 값 을 이 용 하 여 ㅠ 0 ㅠ _120101, 10』 을 구 하 
여 특 징 으 


로 사 용 한 다. 
= 꼬 1 으 123... (8) 
082 으 223... 
. 2 
21 = 1000 (9) 


5->0108217 


여기서 버 = / ㅁ 으로 2 ㅁ ㅠ < 는 번째 분할 영 역 에 
포 함 되어 있는 화 소 의 수 이 며 , ㅁ 은 전체 어 트 랙 터 를 
구 성 하는 화 소 의 수, 찌 은 전체 분할 영 역 을 나타낸다. 


4. 실험 및 고찰 


문 서 영 상 의 입 력 은 82-6300 를 이 용 하 여 300 ㅁ 0021 
의 해 상 도 로 입 력 하였으며, 기준 폰 트 는 한 글 과 컴퓨 
터 0 의 신 명 조 체 100017[ 를 사 용 하였다. 본 연 구 에서 
는 최 적 의 문자 영상 특 징 값 을 구하기 위하여, 축소 
을 8 값 의 변 화 에 따른 문자 영 상 의 프 렉 탈 차 원 을 
추 정 하였다. 


4.1 6=1/4 일 경우 

축 소 율 (6) 을 1/4 로 하여, 전체 어 트 랙 터 를 4*4( 총 
16) 개 셀로 분 할 한 후, 프랙탈 차 원 을 나타내는 
20-0 ㅇ @00400708 10127 과 낌 20281 5416860176, 1010 ㄷ _216, 
1010 _ 1010 을 구 하 였다. 검 토 결과, 셀 을 너무 크게 
설 정 함으로써 한글 2350 자 에 대한 분 류 가 제대로 되 
지 않았다. 


4.2 6=1/8 일 경우 


(그림 3) 에 나타낸 바와 같이 축 소 율 (68) 을 18 로 하 
여 , 전체 어 트 랙 터 를 8*8( 총 64) 개 셀로 분할 실 험 한 
결과, 한글 2350 자 에 대해 15 개 의 대분류 그 룹 으 로 
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그림 3. 프랙탈 차 원 (6=1/8 일 경우) 


나눌 수 있어, 문자 특 징 을 가장 잘 반 영 하는 것으로 
나타났다. 따라서, 최종 실 험 은 6=18 로 하였다. 


4.3 5=1/16 일 경우 


축 소 율 (8) 을 1/16 로 하여, 전체 어 트 랙 터 를 16616 
(총 256) 개 셀로 분 할 하였다. 

검토 결과, 한글 2350 자 에 대한 분 류 가 너무 세분 
화 되어 인 식 기 에 부 담 이 되었다. 


4.4. 실험 결과 및 고찰 

축 소 율 (6) 을 1/8 로 하여, 한글 2350 자 에 대하여 대 
분 류 에 는 20※-(>0414018 1007 을 중 분 류 에는 1010「_ 
1021, 소 분 류 에는 1107 ㅠ _131[ 를 이용 실 험 한 결과, 99.49% 
의 분 류 율 과 초당 26 자 의 인 식 속 도 를 나 타 내 었다. 

검 토 결 과, 107 _1 의 근소한 차 이 로 인해 소분류 
에 비 제 고 12 자 에 대해서는 티 601731 027685416 를 이 
용 재 분 경우 분 류 기 에 부 담 은 있지만 완벽한 
분 류 가 가 능 하 였다. 

(그림 4) 에 는 제 안 된 시 스 템 의 문 자 인 식 과 정 올 , 
(그림 5) 에 는 한글 2350 자 에 대한 실 험 결 과 의 일부 
예 를 나 타 내 었다. 


그림 4. 제 안 된 시 스 템 의 문 자 인식 과정 
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1.233480 


1.269118 


1.112938 
1.121819 


1.018384 
1.027143 
1.034238 


3.055153 
3.081430 
3.102715 


뿔 
될 
녹 
윙 
동 


1.115964 
1.119132 
1.123600 


1.040385 


3.347892 
3.357397 


3.370801 
3.121154 
1.566813 3.169016 ㅣ 1.056339 
3.212972 ㅣ 1.070991 
3.290657 ㅣ 1.096886 


형 식 분류 15 종 , 총 문 자 수 한글 2350 자 


또 | @ 쪼아 - 


매 뿌 


그림 5. 실험 결과 
5. 결 론 


본 논 문 에서는 미세한 차 이 를 고감도 식 별 하는 카 
오스 이 론 의 프랙탈 차 원 과 스 트 레 인 즈 어 트 랙 터 를 
생 성 하는 수 정 된 에 농 함 수 를 이 용 하 여 , 한글 2350 
자 에 대한 시계열 데 이 터 의 혼 도 도 를 분 석 하 기 위해, 
각 각 의 문자 어 트 랙 터 를 구성한 후, 프랙탈 차 원 을 


나타내는 20×-0002000@ 101060910 ㅁ 및 지하 


1688416, 1041017080070 2, 10【00018600 12124605102 
등 을 구하여 문자 특 징 을 추 출 하 는 새로운 알고리즘 
을 제 시 하였다. 실 험 결과 한글 2350 자 에 대하여 
99.49% 의 분 류 을 을 나타내어 제 안 된 방 법 의 유효성 
을 보였다, 본 논 문 에서는 기 존 의 어 트 랙 터 구성 방 
법 과 는 다른 방 법 으로 문자 패 턴 에 서 의 카오스 현상 
을 찾기 위해 노 력 하 였다. 이러한 연 구 는 인식 시스 
템 개발 분 야 에서 중요한 학문적 자 료 가 될 수 있을 
것이며, 문 차 인식 분야 뿐만 아니라 지문 인식, 얼굴 
화상 인식, 서명 인식 등 개인 인증 분 야 에 폭 넓게 
웅 용 할 수 있을 것으로 본다. 
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